多模式高吞吐生物数据为科学研究提供了巨大的机会和重大的计算挑战。在多模式测量中,每个样本同时被两个或更多传感器集合观察。在这种环境下,两种模式中的许多观察变量通常是干扰项,不 carry有关感兴趣现象的信息。在此,我们提出了一种多模式无监督特征选择框架:根据耦合的高维度测量识别信息变量。我们的方法旨在识别与两种潜在低维度结构相关的特征:(i)共享结构,控制两种模式的观察结果,以及(ii)仅出现在一种模式中的差异结构。为此,我们提出了两种基于拉普拉斯的评分算子。我们将得分与可微分门相结合,掩盖干扰性特征并提高图拉普拉斯捕获的结构的准确性。新方案的性能使用合成和真实数据集进行说明,包括对单细胞多组学的扩展生物学应用。
论文链接:http://arxiv.org/pdf/2303.09381v1
更多计算机论文:http://cspaper.cn/